FORMÁLNÍ GRAMATIKA

Základní

Vymezení a popis přirozených jazyků (zejména jejich syntaktické struktury). Termín f.g. lze užít ve dvou významech: (a) jako synonymum ↗gramatiky generativní, (b) jako jakýkoli exaktní, explicitní, formalizovaný popis gramatiky (zvl. syntaxe) přirozeného i umělého jazyka, tj. např. jazyka programovacího, jazyka logiky apod. Ve významu (b), a omezíme‑li se v dalším na jazyk přirozený, je f.g. souborem lingvistických objektů, tvrzení, pravidel a principů zapsaných matematicky přesně a jednoznačně tak, aby se daly počítačově implementovat. Takovou f.g. je např. systém pravidel, principů a objektů syntaktické analýzy (↗parsing) či syntézy jazyka, systém automatické morfologické ↗disambiguace n. ↗disambiguace lexikálních významů, systém zachycující fonologii, morfologii či morfematiku jazyka (např. lemmatizace, morfologická analýza, morfematická analýza rozkládající slovo na morfémy/morfy apod.). Formalizace gramatiky je klíčová v tom, že počítačová implementace gramatiky umožňuje ověřit její správnost. Pro parsing a v různých gramatických formalismech se obvykle užívá různě uzpůsobené ↗generativní gramatiky (např. některé unifikační gramatiky užívají klasických generativních gramatik, jejichž přepisovací pravidla jsou obohacena o sestavy rysů, vstupující do operace unifikace, jež zajišťuje především gramatickou kompatibilitu elementů, na něž se pravidlo aplikuje).

Rozšiřující

Některé typy formálních gramatik (g.)

(a) Transformační gramatiky obsahují dodatkově (tj. kromě přepisovacích pravidel) i tzv. ↗transformace (transformační pravidla), které formálně vyjadřují fáze derivace původně z hloubkové do povrchové struktury, později jako jediná transformace move α a v poslední fázi se termín transformace z gramatik tohoto typu vytrácí. Generativní síla těchto g. je vyšší než u g. typu 2, přičemž (na rozdíl od typu 1 a 0) mohou vystihovat specifičnost přirozeného jaz; viz ↗Chomského hierarchie gramatik a jazyků. Transformace (jakožto operace generující z jedné povrchové struktury jinou povrchovou strukturu) používá (byť bez formalismu) i č. školní syntax (nesystematicky, např. pro derivaci pasiva z aktiva, pro derivaci nominalizací z finitních vět aj. např. ✍SČ, 1998), a vědecká závislostní gramatika (pro mnoho derivací), např.  3, 1987. Viz také ↗transformace; ↗TGG, ↗G&B, ↗MP.

(b) Závislostní gramatiky jsou na rozdíl od ↗bezkontextových g. založeny na přímých vztazích syntaktické závislosti mezi jednotlivými slovy ve větě. Strukturu věty tak tvoří pouze její slova a vztahy mezi nimi – závislostní g. nepoužívá neterminálních symbolů. Závislostní struktura věty bývá zachycena v podobě ↗závislostního stromu, v němž pro každý uzel u (s výjimkou vrcholu neboli kořenu) existuje jediný uzel v takový, že u je podřízen uzlu v nějakým typem syntaktické závislosti a příslušná slova přiřazená těmto uzlům jsou spolu ve vztahu této závislosti. Vrchol závislostní struktury netvoří symbol pro větu jako u složkových g., nýbrž uzel reprezentující finitní sloveso hlavní klauze. Na vztahu závislosti jsou založeny zejména ↗FGP, ↗MTT, word grammar (✍Hudson, 1984). Viz také ↗dominace.

(c) Kategoriální gramatiky jsou tvořeny množinou tzv. základních syntaktických kategorií (neterminálních symbolů – např. N (podstatné jméno), N\S (intranzitivní sloveso – viz níže), atd.), z nichž každé je přiřazena množina slov jazyka (terminálních symbolů) patřících do této kategorie, dále množinou elementárních operací vytvářejících z těchto kategorií odvozené syntaktické struktury a majících podobu jednostranného „krácení abstraktních zlomků“ (X X\Y → Y, X/Y Y → X, kde X, Y jsou proměnné za neterminální symboly), a konečně vyznačenou základní kategorií pro větu. Je‑li např. S základní kategorií pro větu a N základní kategorií pro subst., pak intranzitivní sloveso lze zachytit jako „zlomek“ N\S (rozuměj: intranzitivní sloveso je slovo, jež je vlastně větou, ve které chybí vlevo stojící podstatné jméno – podmět). Pokud tedy nalevo od takového slovesa postavíme subst., dostaneme posloupnost symbolů N N\S, což po „zkrácení“ dává S, tedy větu. Jazyk vymezený kategoriální g. je tvořen těmi řetězci terminálních symbolů, které lze postupným „krácením“ redukovat na základní kategorii pro větu. Základy kategoriální g. položili ve 30. letech 20. stol. polští logikové Leśniewski a Ajdukiewicz, ale hlavní uplatnění nalezly tyto gramatiky v lingvistice zejm. při popisu jazyků s pevným slovosledem (např. angl.). Z hlediska slabé (generativní) síly jsou kategoriální g. ekvivalentní ↗bezkontextovým gramatikám. Příkladem kategoriální unifikační g. je ✍Uszkoreit (1996); o kategoriálních g. viz dále ✍Steedman (2000), ✍Szabolcsi(ová) (1992), ✍Morrill (2010).

(d) Unifikační gramatiky jsou založeny na tzv. unifikaci, což je operace, která z konečného počtu dílčích informací vyjádřených tzv. sestavou rysů (feature structure) vytvoří novou strukturu (opět v podobě sestavy rysů), která bude obsahovat všechny vstupní dílčí informace a žádné informace navíc, to však pouze v případě, že různé dílčí informace neobsahují navzájem konfliktní informaci. Pojem unifikační gramatika (do lingvistiky jej zavedl lingvista a matematik M. Kay) vedl ke vzniku řady gramatických systémů (zejména v západní lingvistice) pojatých deklarativně (tj. staticky, neprocedurálně, tedy bez ohledu na směr zpracování, tj. bez ohledu na analýzu či syntézu), jako je např. ↗LFG, ↗HPSG aj.

Na rozdíl od formalismů procedurálních (takovými jsou např. ↗FGP či ↗TGG), kde je vztah mezi významem a výrazem realizován změnou, nahrazením, transformací jedněch struktur jinými, umožňuje deklarativní gramatický formalismus jen aditivní spojování nekonfliktních dílčích informací, přičemž podstatná je výsledná informace, nikoliv (na rozdíl od transformačních g.) pořadí, v jakém se tyto dílčí informace dané gramatickými pravidly, obecnými principy a slovníkovými informacemi spojují. (Ne)gramatičnost výsledné struktury se převádí na vzájemnou (ne)slučitelnost informací přiřazených dílčím strukturám.

Literatura
  • Češka, M. Gramatiky a jazyky, 1992.
  • Habiballa, H. Regulární a bezkontextové jazyky, 2005.
  • Harrison, M. A. Introduction to Formal Language Theory, 1978.
  • Hausser, R. Foundations of Computational Linguistics. Human-Computer Communication in Natural Language, 2001.
  • Hopcroft, J. E. & J. D. Ullman. Formal Languages and their Relation to Automata, 1978.
  • Hudson, R. A. Word Grammar, 1984.
  • Chomsky, N. Syntactic Structures, 1957 (č. překlad: Syntaktické struktury, 1966).
  • Chomsky, N. On Certain Formal Properties of Grammars. Information and Control 2, 1959, 137–167.
  • Chomsky, N. The Logical Structure of Linguistic Theory, 1975.
  • Chytil, M. Teorie automatů a formálních jazyků, 1978.
  • Chytil, M. Automaty a gramatiky, 1984.
  • Kaplan, R. M. & J. Bresnan. Lexical-Functional Grammar: A Formal System for Grammatical Representation. In Bresnan, J. (ed.), The Mental Representation of Grammatical Relations, 1982, 173–281.
  • Krulee, G. K. Computer Processing of Natural Language, 1991.
  • Levelt, W. J. M. An Introduction to the Theory of Formal Languages and Automata, 2008.
  • Manaster-Ramer, A. (ed.) Mathematics of Language, 1987.
  • Martinek, P. Základy teoretické informatiky, 2006.
  • 3, 1987.
  • Morrill, G. Categorial Grammar: Logical Syntax, Semantics, and Processing, 2010.
  • Oehrle, R. T. & E. Bach ad. (eds.) Categorial Grammars and Natural Language Structures, 1988.
  • Partee, B. H. & A. ter Meulen ad. Mathematical Methods in Linguistics, 1990.
  • Pollard, C. & I. A. Sag. Head-driven Phrase Structure Grammar, 1994.
  • Rozenberg, G. & A. Salomaa. (eds.) Handbook of Formal Languages 1–3, 1997.
  • Salomaa, A. Formal Languages, 1973.
  • Savitch, W. J. & E. Bach ad. (eds.) The Formal Complexity of Natural Language, 1987, 320–334.
  • , 1998.
  • Shieber, S. An Introduction to Unification-based Approaches to Grammar, 1986.
  • Steedman, M. The Syntactic Process, 2000.
  • Szabolcsi, A. Combinatory Grammar and Projection from the Lexicon. In Sag, I. & A. Szabolcsi (eds.), Lexical Matters, 1992, 241–269.
  • Těstělec, Ja. G. Vveděnije v obščij sintaksis, 2001.
  • Uszkoreit, H. Categorial Unification Grammars, 1996.
  • Wintner, S. Unification-Based Linguistic Formalisms, 1998.
Citace
Vladimír Petkevič, Karel Oliva (2017): FORMÁLNÍ GRAMATIKA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/FORMÁLNÍ GRAMATIKA (poslední přístup: 21. 11. 2024)

Další pojmy:

gramatika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka